home *** CD-ROM | disk | FTP | other *** search
/ Collection of Internet / Collection of Internet.iso / infosrvr / dev / www_talk.930 / 000661_VMNETNEW@slacvm….stanford.edu _Tue Feb 23 00:30:25 1993.msg < prev    next >
Internet Message Format  |  1994-01-24  |  21KB

  1. Return-Path: <VMNETNEW@slacvm.slac.stanford.edu>
  2. Received: from dxmint.cern.ch by  nxoc01.cern.ch  (NeXT-1.0 (From Sendmail 5.52)/NeXT-2.0)
  3.     id AA12549; Tue, 23 Feb 93 00:30:25 MET
  4. Received: from SCS.SLAC.Stanford.EDU by dxmint.cern.ch (5.65/DEC-Ultrix/4.3)
  5.     id AA01187; Tue, 23 Feb 1993 00:47:31 +0100
  6. Received: from SLACVM.SLAC.STANFORD.EDU (MAILER@SLACVM) by
  7.  SCS.SLAC.STANFORD.EDU with PMDF#10283; Mon, 22 Feb 1993 10:05 PDT
  8. Received: by SLACVM (Mailer R2.08 R208004) id 0765; Mon, 22 Feb 93 10:00:55 PST
  9. Date: Mon, 22 Feb 1993 17:10:13 GMT
  10. From: marcus@x4u.desy.de (Marcus Speh)
  11. Subject: Info on Hypertext format ?
  12. Sender: VMNETNEW@slacvm.slac.stanford.edu
  13. To: WWW-TALK@nxoc01.cern.ch
  14. Message-Id: <MARCUS.93Feb22181013@x4u.desy.de>
  15. X-Envelope-To: WWW-TALK@INFO.CERN.CH
  16. Newsgroups: slac.www.talk,slac.www.interest
  17. Path: slacvm!unixhub!dxcern!dscomsa!marcus
  18. Lines: 449
  19. X-Sender: usenet@dscomsa.desy.de (usenet)
  20. Organization: Deutsches Elektronen-Synchrotron, Hamburg, Germany.
  21.  
  22. Someone from the DESY computer centre assured me
  23. that this was the Hyper-FAQ to the WWW-wizards. I hope
  24. to pass your kill-file nevertheless. [The same person
  25. did not have any clue how to answer my question.]
  26.      
  27. I wanted to start a FAQ for one of the hepnet.* newsgroups.
  28. Since the freeHEP server at freehep.scri.fsu.edu is tied to
  29. WWW, and it also archives the hepnet hierarchy, my question
  30. is: how do I format my FAQ in Hypertext?
  31.      
  32.     Besides the question, I also have an information to
  33. give: on the faq-maintainers mailing list, there is a BIG
  34. debate right now on standard formats for FAQs. The discussion
  35. was started by Thomas A. Fine's posting to the list which I
  36. repost here--though I don't assume that the WWWmasters haven't
  37. heard about it. In the future, the project he outlines may be
  38. the cheapest way of getting your FAQ into Hypertext, but right
  39. now the possibility does not seem to exist.
  40.      
  41. I'd like to know what you guys think.
  42.      
  43.   --Marcus Speh
  44.   --<marcus@x4u.desy.de>
  45.      
  46.      
  47.      
  48. ------------------------------ cut here -----------------------------
  49. From: Thomas A. Fine <fine@cis.ohio-state.edu>
  50. To: faq-maintainers@MIT.EDU
  51. Subject: Converting FAQs to hypertext
  52. Date: Fri, 12 Feb 93 20:55:55 -0500
  53.      
  54.      
  55. I'm trying to develop a project which will convert FAQs into hypertext
  56. documents under the World Wide Web system.  I have a specification,
  57. which is included, for a standard format for FAQs such that they can
  58. easily be translated into hypertext documents.  We will translate all
  59. conforming FAQs at Ohio State, and make them available to the world in
  60. hypertext.  I'd like to let everyone have a look at what I'm doing, so
  61. you can point out problems before I go ahead and do it.
  62.      
  63. First I'd like to make certain things clear:
  64.      
  65.   * We can deal with more than one format.  If you find what I've done
  66.     too restrictive, we can probably develop software that will turn
  67.     your own format into hypertext.  I would encourage the development
  68.     of several different formats, as long as "several" is substantially
  69.     less than the total number of news.answers postings.
  70.      
  71.   * The development of additional formats and software is fairly easy.
  72.     When the original concept was developed, I wrote perl scripts to
  73.     convert comp.lang.perl and comp.unix.questions FAQs to hypertext
  74.     (different software for each), in about 3 hours.  Software for
  75.     the format I'm recommending was also fairly easy, although it has
  76.     been tweaked on a fair bit, so it was more than three hours.
  77.      
  78.   * The format that I'm proposing is very flexible, IMHO.  It is designed
  79.     for generic documents as well as lists of questions and answers.
  80.      
  81.   * My format preserves most of the text formatting of the original
  82.     document.
  83.      
  84.   * I'm very open to suggestions, volunteers, etc.
  85.      
  86.   * I don't want to make conformance to ANY format a posting requirement.
  87.     If you choose not to conform to anything, you just won't have your
  88.     posting turned into hypertext.
  89.      
  90.   * If you know about WWW and want to supply your FAQ to us directly as
  91.     hypertext, we can make arrangements for that.
  92.      
  93.   * Submission of FAQs to us will be through two different methods.  The
  94.     most painless is post it to news.answers -- we'll scan it and
  95.     convert anything we find that conforms (we may scan other
  96.     newsgroups as well).  The other method will be to send us mail to
  97.     <an address that hasn't been set up yet>.  This method will provide
  98.     faster response that you might want if you are modifying your FAQ
  99.     and want to see it in hypertext.
  100.      
  101.   * The conversion software will be available (this is a requirement for
  102.     contributed software and formats).  Currently, we have software which
  103.     converts a document, but we don't have any software for scanning news
  104.     or catching mail.  Fairly trivial though.
  105.      
  106. Background
  107.      
  108. World Wide Web is a networked information retrieval system, with its own
  109. hypertext documents at its base.  Even though WWW is still under development
  110. much of it is already solid, and there are already several applications
  111. and a nice amount of information available.  WWW can interface with both
  112. WAIS and Gopher, and interfaces with other systems have been prototyped.
  113. It is ideal as a local help system, as code already exists for converting
  114. man pages, RFCs, emacs info documents, and lots of other things into
  115. hypertext.
  116.      
  117. Currently, WWW only supports hypertext documents, although plans are being
  118. made for a protocol which will deal with all MIME document types.  Lots
  119. of other ideas are being passed around and there's still much to be done.
  120. Volunteers are welcome.  There is a mailing list; subscribe via
  121. www-talk-request@nxoc01.cern.ch.  Hopefully we will have our own newsgroup
  122. soon.
  123.      
  124. What follows is several things in one:  It is a rough draft of what will
  125. be posted monthly to news.answers describing this project.  It is a
  126. description of the format.  And it conforms to the format, and therefore
  127. serves as an example.  A formatted version is available if you grab the
  128. software (information is available in the document).
  129.      
  130. I'd very much prefer that you look at the hypertext results before
  131. commenting.  If you don't want to go through the hassle of compiling
  132. the software, XMosaic is available in binary form (see below).
  133.      
  134.      tom
  135.      
  136. ----------------------------------------------------------------------------
  137.      
  138. Path: cis.ohio-stae.edu
  139. From: fine@cis.ohio-state.edu (Thomas A Fine)
  140. Newsgroups: news.misc,comp.infosystems,comp.answers,news.answers
  141. Subject: The World Wide Web FAQ Project
  142. Followup-To: comp.infosystems
  143. Date: 11 Feb 1993 15:08:54 -0500
  144. Expires: 11 Mar 1993 00:00:00 GMT
  145. Summary: Information on the conversion of FAQs to WWW hypertext documents
  146. Organization: The Ohio State University Dept. of Computer and Info. Science
  147. Lines: 240
  148. Message-ID: <asdfINN123@soccer.cis.ohio-state.edu>
  149. NNTP-Posting-Host: soccer.cis.ohio-state.edu
  150. Content-Type: text/x-usenet-FAQ;
  151.     version=1.0;
  152.     title="Hypertext FAQs"
  153.      
  154. Archive-name: hypertext-faq-format
  155. Last-modified: 1993/02/11
  156.      
  157. Statement of Intent
  158. -------------------
  159.      
  160. FAQs are a wonderful resource, but hard to work through.  This project
  161. is an attempt to unite the volume of information found in news.answers
  162. and other newsgroups with The World Wide Web, a system for networked
  163. information retrieval.
  164.      
  165. World Wide Web uses hypertext documents and a network transport
  166. protocol to build a huge web of information all over the world.
  167. Accessing documents is as easy as clicking on a mouse.  (there are
  168. tty-based interfaces available too).  WWW (as we like to call it, for
  169. obvious reasons) also knows how to talk to other services including
  170. WAIS and Gopher.  There are plans to extend the document type to be a
  171. MIME document, of which WWW's hypertext (called HTML, for HyperText
  172. Markup Language) will be one part.
  173.      
  174. Since we don't expect everyone to learn HTML (although it is fairly
  175. straight forward), we have designed a format that can be used for
  176. news.answers (et. al) documents and FAQs which will allow us to
  177. automatically convert them to hypertext.  The format has been designed
  178. to allow FAQ maintainers to providing conforming news articles with
  179. minimal changes.  Note that while this is currently the only format,
  180. it is possible to support multiple formats.
  181.      
  182. The format is described in following sections.  Note that this article
  183. itself conforms to the format, and a formatted version is available thru
  184. the Web (See "Getting WWW Software").
  185.      
  186. Getting WWW Software
  187. --------------------
  188.      
  189. To see what this document looks like after it's been formatted, grab
  190. yourself some software and give it a try.  The software is available
  191. via anon ftp from various places.  There are several different packages
  192. available:
  193.      
  194. ftp.ncsa.uiuc.edu in /Web/xmosaic
  195.   xmosaic-0.7.tar.Z                X11 browser - fairly new, very nice.
  196.                    (binary available in the dir binaries-0.7)
  197.      
  198. info.cern.ch in /pub/www/src
  199.   tkWWW-0.4.tar.Z                  X11 browser - Tcl/Tk implementation
  200.   viola920730.tar.Z                X11 browser - a bit out of date
  201.   midaswww-1.0.tar.Z               X11 browser - new version expected soon
  202.   WWWLineMode_1.3b.tar.Z           dumb terminal browser
  203.   WWWNextStep_0.15.tar.Z           A NextStep browser and editor
  204.   www_and_frame-0.2.tar.Z          A package for editing HTML with FrameMaker
  205.   [my tty-based browser and editor will hopefully be included soon]
  206.      
  207. To find the FAQ stuff in the Web, you will need the following Universal
  208. Resource Locator, which can be typed into your browser in an application
  209. specific way (the XMosaic author promised to include a built-in link to
  210. the information):
  211.      
  212.   "http://www.cis.ohio-state.edu:80/hypertext/faq/usenet/FAQ-List.html"
  213.      
  214. The hypertext documents produced from conforming FAQs uses few of the
  215. features of html, and so will look rather plain looking.  If you would
  216. like more information, start by getting the software and rummaging
  217. around the web.  You can also get on the www-talk mailing list by
  218. sending to www-talk-request@nxoc01.cern.ch.  Lastly, you could bug me
  219. with mail if you were really desparate.  If after seeing what this
  220. system can do, you decide you want to provide your documentation
  221. directly as hypertext, contact me (fine@cis.ohio-state.edu) and we'll
  222. work out the details.  Send questions about this format to the same.
  223.      
  224. The Header Format
  225. -----------------
  226. [Note that when "article" is used, a single article is being referred to.
  227.  When "posting" is used, the entire set of articles are being referred to.]
  228.      
  229. In order to be recognized as a conforming article, it must use MIME
  230. headers as follows:
  231.      
  232. For single-article postings, the header must include:
  233.      
  234.   Content-type: text/x-usenet-FAQ
  235.      
  236. In addition, two fields can be added to this line:
  237.      
  238.   version=1.0
  239.      
  240. This indicates the version number to process the file with.  If absent,
  241. version 1.0 will be assumed.  The other field:
  242.      
  243.   title="The title of the article"
  244.      
  245. This will be used in various places in the conversion to hypertext.  If
  246. not present, the subject line (in its entirity) of the first article
  247. of the posting will be used as the title of that posting.  The posting
  248. title must be unique.
  249.      
  250. Note that when attributes are used, semicolons should also be used
  251. after the Content-type, and after each attribute except for the last:
  252.      
  253.   Content-type: text/x-usenet-FAQ;
  254.       version=1.0;
  255.       title="Blarg"
  256.      
  257. For multiple-article postings, the Content-type information as described
  258. above should be the first thing found in the BODY of the first article
  259. of the posting (it can be included in the secondary header with
  260. Archive-name and Version lines found in many FAQs).  In addition, each
  261. article header must contain the MIME multipart information:
  262.      
  263.   Content-type: message/partial;
  264.       number=1;
  265.       total=3;
  266.       id="totally-unique-id-string"
  267.      
  268. The "total" attribute is only required on the final part of the document.
  269. The id will be the same for each article in the posting, but is supposed
  270. to be guarenteed unique among postings.  A format similar to the typical
  271. news message id is recommended, e.g. something including the poster and
  272. the posting host along with an id unique to that host (the time).
  273.      
  274. The Body Format
  275. ---------------
  276. The content is fairly free-form.  It can contain any of the following
  277. "sections"
  278.      
  279.     Documents
  280.     Ignored text
  281.     Questions/Answers
  282.      
  283. The Ignored text is stripped out first, then the articles are appended,
  284. together.  The converter then expects to see a series of "Documents"
  285. and or "Questions/Answers" sections.  These are all described
  286. below if you are in text, or are links at the top level, if you
  287. are in hypertext.
  288.      
  289. These will be formatted into a top level hypertext document with links
  290. to all the other documents.  The software will attempt to handle simple
  291. subsets of this format accordingly; for instance if a posting consists
  292. entirely of a single questions/answers section, the conversion will
  293. show the list of questions as the top level of the hypertext (this
  294. hasn't been implemented yet).
  295.      
  296. Each of the Documents or Questions/Answers sections must be started
  297. with a blank line, a left-justified title line, and a left-justified
  298. line of dashes to underscore the title.  The only exception is a posting
  299. which is either a single document, or a single set of questions/answers,
  300. in which case no such title is required anywhere.  Also, the first
  301. section does not require such a title; if it is left out, the title
  302. "Introduction" will be used.
  303.      
  304. Documents
  305. ---------
  306. A document section is just any section of text, separated by the section
  307. title described previously, and not matching the Questions/Answers form.
  308. This means you must make sure no line in a document section starts with
  309. a number followed by a right parenthesis.
  310.      
  311. This section on "Documents" you are reading now will be an entire
  312. hypertext document after conversion (this may not be the best
  313. choice for the hypertext layout, but makes a good example.)
  314.      
  315. Ignored Text
  316. ------------
  317. Some text can be ignored in the posting.  Typically in news articles, you
  318. may need to include some redundant text in every article, that won't be
  319. needed in the hypertext.  Also some information, like how to unpack the
  320. articles might be unneeded.  Lists of questions are another example, since
  321. the conversion software builds this list from the questions themselves.
  322.      
  323. To mark text as uneeded, it should be surrounded by lines consisting only
  324. of "--".
  325.      
  326. An example starts here:
  327. --
  328. This text won't show up in the hypertext.
  329. --
  330. That was the example.  Note that if you are looking at the hypertext, there
  331. was nothing between the start and the end, because it was ignored.
  332.      
  333. Important note:  Text will stop being ignored at the end of each ARTICLE,
  334. even if there is no ending "--".  (This can be used to  eliminate
  335. signatures, since lots of people use the "--" there anyway.)
  336.      
  337. Questions/Answers
  338. -----------------
  339. Any section which contains a left justified number followed by a right
  340. parenthesis and then white space will be treated as a Questions/Answers
  341. section.  The number can contain several decimal points, so "1.4.11) "
  342. is an acceptable starting string for a question.
  343.      
  344. The requirements for this section can be summed up as:
  345. * There must be a blank line before and after each question.
  346. * All answer text must be indented from the left margin.
  347. * All questions must be have no indentation on the first line.
  348. * All questions start with a number, a right parenthesis, and some whitespace.
  349.      
  350. There can be a section title for some portion of the questions.  It
  351. must have no indentation, and must be preceded by blank line, and
  352. followed by a blank line and then a question.  It cannot start with a
  353. number!
  354.      
  355. Creating Additional Links
  356. -------------------------
  357. Anywhere where the string ``(See "document title")'' occurs, a link
  358. will be created to that document if it exists.  This link is just
  359. an example: (See "Questions/Answers").
  360.      
  361. If you are going to do this, make sure you refer to a document title
  362. that is unique.  All non-unique references will be ignored.
  363.      
  364. Questions and Answers
  365. ---------------------
  366.      
  367. Section 1.  The Documents
  368.      
  369. 1.1) What is the documents section for?
  370.      
  371.   For introductions to newsgroups, introductions to FAQs, and other
  372.   postings of interest for a newsgroup that don't fall into the question
  373.   and answer scheme.
  374.      
  375. 1.2) What if I have only a single document (and no questions)?
  376.      
  377.   Then make sure there are zero or one document titles (a title line
  378.   followed by a line of dashes), and nothing that looks like the start
  379.   of a Question/Answer section.
  380.      
  381.      
  382. Section 2.  The Question/Answer portion of the FAQ
  383.      
  384. 2.1) What if my question is too
  385.      long to fit on one line?
  386.      
  387.   Just make sure you don't put a blank line in the question.  The software
  388.   will deal correctly.
  389.      
  390. 2.2) How do you distinguish section titles from questions, if both
  391. start at the beginning of the line?
  392.      
  393.   Sections titles can not start with numbers.  Questions have to start with
  394.   a number, followed by a right parenthesis and then whitespace.
  395.      
  396. 2.3) Where, exactly, should I put blank lines
  397.      
  398.   A blank line has to occur before and after each question.  Blank lines
  399.   must also occur before each section title.  All other blank lines will
  400.   be preserved.
  401.      
  402. Section 3.  Other questions
  403.      
  404. 3.1) Can I create additional links?
  405.      
  406.   Yeah, just put in text that looks like this:
  407.      
  408.       (See "Creating Additional Links")
  409.      
  410.   It must refer to a Document title or Q/A title somewhere in the posting.
  411.      
  412. 3.2) Can I do tree structuring?
  413.      
  414.   The format is converted into a three level tree, but you can't impose
  415.   any other structure on it, unless you want to provide your documentation
  416.   directly as hypertext.
  417.      
  418. 3.3) What if I don't like your format?
  419.      
  420.   Come up with your own.  We may even help you write the software to convert
  421.   it.  Since the format requires a version number, its easy for us to support
  422.   multiple versions at the same time.
  423.      
  424.   If you do decide to create your own format, it would be best if it would
  425.   be general enough for more than your own postings, as we think it would
  426.   be a little cumbersome having a separate piece of software for every
  427.   different posting.
  428.      
  429. 3.4) Since this uses MIME headers, will there be an application
  430.      to read such documents with a MIME news/mail reader?
  431.      
  432.   Eventually, but not now.
  433.      
  434. 3.5) Why didn't you use SeText format?
  435.      
  436.   Because we wanted to get this done quickly, and SeText isn't a fully
  437.   realized standard yet.  Also, its not clear that SeText will handle
  438.   all the functionality we needed.  It is possible that future versions
  439.   will be based on SeText, or at least include some of its features.
  440.      
  441.   BTW SeText is a pseudo-markup language for text documents.  All the
  442.   markups are chosen as items which won't interfere with the reading
  443.   of the document in an unformatted state.  Neat stuff, but not ripe
  444.   yet.
  445.      
  446. About this posting
  447. ------------------
  448. This is posted monthly to news.answers, comp.answers, comp.infosystems,
  449. and news.misc.  If changes are made between posts, no differences will
  450. be posted as the formatted and unformatted versions available through
  451. the web are assumed to be the latest.
  452.      
  453. Send comments and corrections about this posting to fine@cis.ohio-state.edu.
  454. Please send a context diff, or an entire modified version of the file.
  455.      
  456. --
  457. ------------------------------------------------------------------------------
  458. | Thomas A. Fine    | fine@cis.ohio-state.edu   | 2036 Neil Avenue Mall      |
  459. | CIS Staff         | (614) 292-7325            | Columbus, Ohio 43210       |
  460. | The Ohio State University - Department of Computer and Information Science |
  461.      
  462.      
  463.      
  464. --
  465.        //////////////////////////////////////////////////////////
  466.       //   marcus@x4u.desy.de   //  Marcus Speh               //
  467.      //  [131.169.30.33]       //  II. Inst. f. Theor. Phys. //
  468.     // Phone: (040) 8998-2260 //  Luruper Chaussee 149      //
  469.    // FAX: (040) 8998-2267   //  2000 Hamburg 50 / Germany //
  470.   //////////////////////////////////////////////////////////